#21 : ホワイトペーパー「AlteryxによるTableauのためのデータ準備ガイド:決定版」を読んでみた – Alteryx & Tableau 連携 Advent Calendar 2018
当エントリは『Alteryx&Tableau連携 Advent Calendar 2018』シリーズの21本目のエントリです。
- Alteryx & Tableau 連携 Advent Calendar 2018 - Qiita
- Alteryx & Tableau 連携 Advent Calendar 2018 | シリーズ | DevelopersIO
当エントリでは、AlteryxとTableauの連携について書かれたホワイトペーパー 「The Definitive Guide to Preparing Your Data for Tableau」について、その内容を見ていきたいと思います。
目次
AlteryxによるTableauのためのデータ準備ガイド:決定版
「データ分析に関わる人あるある」として、データを準備するのに時間の大半を費やしてしまい、結果データを分析したり可視化する時間が取れない...というのは良く聞く話だと思います。
Alteryxを使うと、そんな課題をスムーズ&スマートに解決することが出来ます。全ての作業は直感的なドラッグアンドドロップワークフローで行われ、再利用可能で変更可能です。その他以下の様な特徴も兼ね備えています。Alteryxを活用する事で、時間を節約してデータをより迅速に視覚化、分析に役立てることができます。
- 複数の異種データソースの高速ブレンド
- データソースをクレンジングおよび整形して出力に最適
- 予測分析と空間アナリティクスによるデータの分析、コーディングは不要
当エントリで紹介するホワイトペーパー「The Definitive Guide to Preparing Your Data for Tableau(Tableauのためのデータ準備ガイド:決定版)」では、Tableauで可視化・分析を行う際にAlteryxを活用する事で得られるメリットやその方法などについてまとめられていますので、順を追って見ていきたいと思います。
視覚化・データブレンドの高速化
今日、殆どのデータアナリストにとって、豊富なデータを元にヴィジュアライゼーション(Viz)を作成する事は分析プロセスに於ける重要なステップとなっています。ビジュアライゼーションを介して、データに隠されたインサイトを明らかにし、必要な回答を見つけ出してビジネスに適した意識決定を行うことが出来ます。
ですが、そういった「効果的なデータ可視化(ビジュアライゼーション)」を作成する際には、作成の元となる「データの準備」に時間や手間が掛かってしまうことが往々にしてあったりします。
優れたビジュアライゼーションを作成するには、予めデータを適切に準備しておく必要があります。
Alteryxはこの「データ準備」作業を強力かつ効果的にサポートします。直感的なドラッグ・アンド・ドロップでワークフローを作成出来、迅速なセルフサービス・データ・ブレンディングを行う事が出来ます。また、Alteryxで作成したワークフローから、データを準備、ブレンド、整形してTableauに直接出力する事も可能です。
データを使って可視化を行う前に押さえておくべきポイントは以下のようなものがあります。
- 様々な種類のデータソースを結合し、クレンジングを行う(データを綺麗にしておく)
- サードパーティのデータソースで内部データを充実させ、洗練された空間分析または予測分析を実行
- Tableauでの可視化を行いやすくするためにデータを変形・整形しておく
データの結合とクレンジング
Alteryxを使用すると、特殊なツールやプログラミング技術を必要とせずに、データをドラッグ&ドロップの繰り返しで迅速にブレンドしていくことが出来ます。
Alteryxは数多くのデータソースに対応していますので、EXCELからデータウェアハウス、ソーシャルメディアアプリ、クラウドのデータ等など、複数の異なる種類のデータソースからデータを結合します。また、同じワークフローで、結合したデータに対して不要なデータの重複排除・解析・データ整理も行えます。
特定の目的に沿ったデータを確実に得るために、Alteryxを活用する事も出来ます。
例えば、「予測モデリング」では、因果関係を確立して将来の結果を予測するために、わずかな特徴の違いを持つ変数群・データセットが必要となります。またこれとは対照的に、ビジュアライゼーションを作成する時は、可能な限り多くのデータを手に入れたいので、性別・所得別・地理別・購入レベル別などの様々な観点からデータを再結合・比較・表示させる必要があります。
Alteryxはこれらの要求のいずれにも応えることが可能なツールです。
データを充実させる
多くの場合、データには多くのコンテキストを必要とします。Alteryxで利用可能な第三者データを活用する事で、短時間で目的を達成することが出来ます。
顧客を、如何にして他の人々と分けて際立たせるか...という必要に迫られてはいませんか?顧客をカテゴライズするために、AlteryxでExperian Mosaicカテゴリを使いましょう。同様の属性を持つ見込み客をターゲットに出来るように、顧客をこれらのカテゴリに対応させることが出来ます。
最も効果的な成果を発揮するであろう、潜在的な店舗の場所はどこになるでしょうか? AlteryxでExperianデータを使うことで、店舗からの運転時間内に何人の顧客が住んでいるかを知ることが出来、その質問に答えることができます。
強力な「予測分析」処理
これまでは「高度に訓練されたデータサイエンティストとプログラマのみが予測分析を実行出来る」と言われてきていました。ですが、Alteryxを使うことで、データ分析者が強力な「予測分析」ツールを活用することが出来るようになります。
更に、Tableauを併用する事で予測分析モデルを簡単に表現し、可視化することが出来ます。
A/Bテストでは、棒グラフを使用して結果を比較することや、バブルチャートを使用してマーケットバスケット分析を可視化し、ある商品の顧客による購入が他の商品の購入にどのように影響するかを示すことも可能です。
- Predictive Analytics
- 予測分析
- Alteryx v11.7:『予測』関連ツールの機能概要&ブログエントリまとめ #alteryx | DevelopersIO
- Alteryx v11.7:『分析』関連ツールの機能概要&ブログエントリまとめ #alteryx | DevelopersIO
「空間解析」処理の活用
Alteryxでは、ドラッグ&ドロップで「空間解析」処理を活用する事も可能です。
空間解析に関するツールを使うことで、購入者がモバイルで購入した際の物理的な位置を追跡したり、小売店舗の分析などを行うことが出来ます。
Tableauで任意の形式の地図を作成する場合であれば、Alteryxの空間解析ツールを使用して、ビジネス意思決定に関連するデータセットを作成することが出来ます。特定エリア内のデータを捕捉するポリゴンを作成し、そのデータを直接Tableauに出力して、運転時間マップ、携帯基地局の範囲、病気の発生エリア、洪水地域などを視覚的に表現することが出来ます。
- Alteryx v11.7:『地理情報』関連ツールの機能概要&ブログエントリまとめ #alteryx | DevelopersIO
- Alteryx Inspire 2017 : 【レポート】空間分析 入門 #alteryx17 | DevelopersIO
- [レポート]トレーニングセッション「高度な空間解析」- Alteyrx Inspire 2018 #alteryx18 | DevelopersIO
- Spatial Objects (空間情報の分析) | Alteryx Predictive Tools 道場 Advent Calendar 2018 #13 | DevelopersIO
データを形作る
Alteryxを使用して、Tableauで簡単にデータを扱えるようにデータを整形出来ます。
「Tableauにとって扱いやすいデータ」というのは幾つかパターンがあるのですが、データをブレンドしてもその様な形式になっていない可能性があります。データを縦持ちから横持ち(もしくは逆のパターン)に変換する必要があるかもしれないし、別の方法でデータを再編成しなければならないかもしれません。
例えば、多くの企業ではアンケートデータを使用していますが、回答データは回答者ごとにまとめられ、長い行に格納されていることが多いです。これをこのまま可視化に用いようとしても、データとしては非常に扱いづらいものがあります。こういった場合、データの形式を変換する事でより扱いやすい形に再形成する必要が出てきます。
Alteryxでは、この手の「データの再構成」の作業を簡素化かつ自動化し、手動で再整形していた時間を数百時間、または数千時間の規模で削減することが出来ます。
データ処理の自動化
AlteryxではTableauに直接ファイルを出力出来るため、ほぼ即時での反復処理が可能となります。必要なのは、新しいデータソースを追加してAlteryxを実行し、結果をTableauで表示するだけです。また、分析モデルを変更してAlteryxで実行し、Tableauで結果を視覚化してInsight(洞察)を発見することもできます。
更新する度にデータを再整理・整形する必要はありません。全て自動化されており、繰り返しの実行が可能です。
またAlteryxでは、Tableauのファイルを使用してTableauワークブックを起動することも出来ます。
データ準備時間の短縮とデータの視覚化時間の短縮
ビジュアライゼーションを作成することは、データ分析の大きな部分を占めており、より重要な作業になってきています。
しかし、費やしている労力が「可視化(自体)の作成」にではなく、「可視化作成のためのデータ準備」に全体の50〜75%を占めている状況なのであれば、トレンドを特定し、リスクを発見し、彼らが必要とする重要な洞察・機会を提供するような「ユーザーに有用な可視化」を提供出来ているとは言えないでしょう。
すばやく答えにつながる豊かな視覚化を作成するには、AlteryxとTableauが必要です。
まとめ
という訳で、『Alteryx & Tableau 連携 Advent Calendar 2018 』21本目、ホワイトペーパー「The Definitive Guide to Preparing Your Data for Tableau」のご紹介でした。Tableauを有効活用する上で、Alteryxがどれだけ有用であるかについて言及した内容となっていましたが、それぞれ内容としても良く纏まっており、まず最初に読むべき資料の1つとしてオススメ出来るものだなと思いました。ユーザーに"刺さる"ポイントは様々ですが、いずれにしてもAlteryxは有用なツールであると改めて認識した次第でした。
引き続き、明日もお楽しみに!
- Alteryx & Tableau 連携 Advent Calendar 2018 - Qiita
- Alteryx & Tableau 連携 Advent Calendar 2018 | シリーズ | DevelopersIO
Alteryxの導入なら、クラスメソッドにおまかせください
日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。